摘要。准确预测药物 - 目标相互作用对于加速药物发现和阐明复杂的生物学机械性至关重要。在这项工作中,我们将药物 - 目标预测构建为异质生物医学知识图(kg)的链接预测,该任务涉及药物,蛋白质,疾病,途径和其他相关实体。传统的kg嵌入方法,例如transe和复杂性,它们依赖于计算密集的阴性采样及其对看不见的药物 - 靶标对的有限概括。为了应对这些挑战,我们提出了多种文化感知采样(MUCOS),这是一个新的框架,优先考虑高密度邻居以捕获显着的结构模式,并将这些模式与contextual嵌入到Bert中。通过统一结构和文本模式并选择性地采样高度启发的模式,可以规定对负抽样的需求,从而显着降低了计算开销,同时提高了新型药物 - 靶标关联和药物目标的预测准确性。在KEGG50K数据集上进行的广泛实验表明,在预测数据集中的任何关系方面,粘液的表现都胜过最先进的基线,在预测数据集中的任何关系方面,粘液的平均互惠等级(MRR)提高了13%,并且在养活的药物量指定性预测中提高了6%。
主要关键词